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摘 要 : [目的 /意义 ] 探 讨 不 同 关键 时 间 点 对 新 兴 研 究 主题 影响 力 的 不 同 表 征 。|[ 方 法 /过 程 ] 首先 ,综述 当前 拐点 时 间 的 
应 用 场景 及 获取 方法 ,并 根据 知识 扩散 中 网 络 节点 增长 机 制 与 特征 构建 新 兴 研 究 主 题 在 创新 演化 路 径 上 的 拐点 
识别 方法 。 其 次 ,对 比分 析 首 次 出 现时 间 、 平 均 时 间 和 扬 点 时 间 的 差异 ,探讨 新 兴 研 究 主 题 产 生 影响 力 的 最 早 时 
间 点 。 最 后 ,以 干细胞 研究 主题 为 实证 领域 ,分 析 不 同 关 键 时 间 点 对 新 兴 研 究 主 题 影响 力 的 不 同 表征 能 力 。[ 结 
果 / 结 论 ] 扬 点 时 间 可 以 比 平均 值 时 间 提 前 识别 有 影响 力 的 主题 。 首 次 出 现时 间 、 平 均 时 间 和 拐点 时 间 在 主题 发 
v 展 路 径 中 意义 区 别 显著 ,新 兴 研 究 主题 在 创新 路 径 中 分 布 时 间 的 确定 需要 综合 3 种 不 同类 型 的 关键 时 间 点 。 
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兴 研 究 主题 识别 作为 预测 科技 创新 研究 的 重要 
E 也 指示 了 科技 创新 研究 的 发 展 方向 。 当 前 主要 
的 科技 创新 型 国家 和 地 区 不 仅 纷纷 资助 新 兴 研 究 ,还 
资 师 利用 科学 计量 方法 评估 受 资助 项 目的 研究 效果 。 
Du 欧洲 研究 委员 会 (European Research Council, 
ERG) 自 2000 年 开始 资助 两 个 项 目 :前 沿 研究 识别 文 
WIESE 模型 的 开发 和 论证 (Development and Verifica- 
tot a Bibliometric model for the Identification of Fron- 
tier Research, DBF) ERC 支持 的 新 兴 研 究 领 域 及 其 评 
估 (Emerging Research Areas and their Coverage by ERC- 
supported projects, ERACEP ) 上。 其 中 , ERACEP mi H 
分 析 了 2009 年 ERC 支持 的 研究 涵盖 的 新 兴 领 域 情 
况 ”。 

美国 情报 高 级 研究 计划 局 (The Intelligence Ad- 
vanced Research Projects Activity, IARPA ) 2011 年 建立 
的 科学 博览 的 预见 与 理解 计划 ( Foresight and Under- 
standing from Scientific Exposition , FUSE ) 以 产生 变革 性 
创新 为 使 命 ,关注 “高 风险 /高 回报 ”项目 ,不 追求 短期 


利益 ,尤其 重视 重大 新 兴 研 究 主题 的 早期 识别 研究 ” 。 
前 瞻 性 识别 新 兴 研 究 主题 ,对 科技 管理 人 员 部 署 创新 
战略 和 优化 资源 配置 至 关 重 要 。 因 此 ,新 兴 研 究 主题 
直 是 重要 的 学 术 研 究 对 象 , 当前 ,新 兴 主 题 和 新 兴 
究 越 来 越 多 的 出 现在 新 闻 出 版 物 和 学 术 期 刊 中 。 与 此 
同时 ,科学 计量 学 已 经 开发 出 多 种 方法 来 监测 科技 创 
新 中 的 新 兴 研 究 主题 ” ,其 中 演化 路 径 是 研究 新 兴 研 
究 主题 的 重要 途径 之 一 。 
新 兴 研 究 主 题 的 演化 路 径 是 指 新 兴 主 题 的 发 展 脉 
28 ,反映 了 技术 创新 的 产生 扩散 和 演化 过 程 。 引 文 分 
析 是 常用 的 科技 演化 路 径 获取 方法 ,领域 主题 基于 引 
文 数据 的 相似 性 ,按照 时 间 轴 聚 类 后 可 获得 主题 演化 
路 径 ”。 通 过 新 兴 主 题 的 演化 路 径 ,可 以 深入 了 解 主 
题 演 化 的 背景 及 突破 性 创新 的 机 制 ,辅助 识别 并 预测 
突破 性 创新 。 除 此 之 外 ,演化 路 径 还 可 以 辅助 判断 新 
兴 研 究 主 题 的 新 前 性 、 增 长 /持久 性 、 连 贯 性 等 不 易 量 
化 的 特征 ,通过 可 视 化 方式 来 分 析 不 确定 性 和 模糊 性 
Kis. 

个 新 兴 研 究 主 题 在 其 生命 周期 内 可 能 多 次 出 现 
在 创新 演化 路 径 上 ,并且 可 能 出 现在 不 同 的 时 间 间 隔 
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中 ,最 终 会 形成 一 个 主题 的 时 间 分 布 。 这 些 主题 的 时 
间 分 布 并 非 均 匀 和 等 价 的 ,而 是 存在 少数 重要 的 “关键 
时 间 点 "。 关 键 时 间 点 是 指 主题 产生 发展、 演化 和 突 
变 等 关键 时 间 点 。 在 演化 路 径 上 不 同类 型 的 时 间 点 对 
标识 新 兴 研 究 主题 的 生命 周期 有 何 区 别 ? 应 该 如 何 运 
用 不 同 的 时 间 点 提高 对 新 兴 研 究 主题 的 监测 和 趋势 追 
踪 能 力 ? 当前 ,科学 文献 累积 值 的 平均 时 间 值 通常 被 
用 作 科学 技术 发 展 路 线 图 中 的 关键 时 间 点 ,但 实际 上 
论文 发 表 与 专利 申请 的 趋势 并 非 线性 累积 ,而 是 近似 
遵循 指数 发 展 的 规律 ,呈现 偏 斜 态 分 布 。 因 此 ,如 果 在 
主题 演化 路 径 的 时 间 轴 上 选择 平均 时 间作 为 其 关键 时 
间 点 将 导致 主题 识别 的 滞后 。 与 此 同时 ,最 早出 版 年 
或 申请 年 可 能 仅 能 表示 零星 的 研究 ,尚未 形成 较 大 的 
影响 。 

j 忆 鉴于 此 ,笔者 分 析 了 3 种 类 型 的 关键 时 间 点 对 表 
征 新 兴 主 题 发 展 影响 力 的 差异 ,尤其 是 对 新 兴 技术 里 
期 久别 具有 重要 作用 的 拐点 时 间 ,同时 探讨 新 兴 研 究 
接 台 最 有 影响 力 的 关键 时 间 点 ,以 便 更 清晰 地 显示 间 
研究 主题 在 演化 路 径 上 的 关键 时 间 点 ,在 此 基础 上 ， 
对 国 分 析 其 他 关键 时 间 点 (首次 出 现时 间 平均 时 间 ) 
与 揭 点 时 间 的 差异 。 本 研究 悍 在 改进 主题 演化 路 径 的 
准确 性 ,以 期 提高 主题 演化 路 径 在 预测 新 兴 研 究 主题 
谈 别 中 的 准确 性 。 


BEXAR 


二 分 析 关 键 时 间 点 对 表征 新 兴 主 题 发 展 影响 力 的 差 
2 需要 了 解 3 个 相关 问题 :新 兴 人 研究 主题 的 演化 特 
f T 点 时 间 在 不 同学 科 领 域 的 应 用 、 拐 点 时 间 的 获取 
方法 。 笔 者 从 这 3 个 方面 综述 已 有 研究 以 期 为 本 文 提 
供 借鉴 。 

2.1 新 兴 研 究 主 题 的 演化 曲线 特征 
科学 文献 传播 网 络 的 形成 初期 带 有 随机 性 特征 ， 
传播 网 络 初期 ,有 的 时 间 段 不 出 现 新 增 节 点 ,而 有 的 时 

间 段 会 出 现 多 个 新 增 方 点 ,网 络 新 增 节 点 的 增长 规律 
与 网 络 结构 相关 ,其 增 速 呈 现 先 快 后 慢 的 总 体 趋 势 。 
随 着 传播 网 络 规模 的 扩大 ,新 加 入 的 网 络 节 点 数目 逐 
渐 增 多 ,而 当 学 科 领 域 发 展 到 某 一 阶段 , 受 限 于 研究 人 
员 的 学 识 水 平和 专业 领域 的 信息 资源 等 ,传播 网 络 的 
增 速 将 呈现 放 缓 趋势, 最终 达到 相对 稳定 的 状态 。 

P. Young ”收集 了 许多 代表 增长 行为 的 时 间 序 


增长 曲线 模型 。 有 些 研究 主要 集中 在 技术 增长 预测 过 
程 的 阶段 问题 与 产业 发 展 曲线 模型 修正 上 。D. Ku- 
charavy 等 提出 了 基于 S 曲线 的 3 个 阶段 的 短期 .中 期 
和 长 期 预测 的 区 别 ,强调 了 Logistic 增长 模型 的 增长 
参数 的 定义 ,并 且 与 RD，Guio ”一 起 讨论 了 基于 
Logistic 生长 函数 的 简单 Logistic .成 分 Logistic 和 Logis- 
tic 替代 模型 在 技术 变化 预测 中 的 应 用 ,有 助 于 新 兴 技 
术 的 长 期 预测 。P. Nguimkeu "^ 为 了 避免 使 用 的 增长 
曲线 导致 预测 误差 ,对 Gompertz 和 Logistic 增长 模型 进 
行 了 简单 模型 的 选择 检验 。N.，Meade 等 '" 考虑 了 不 
同 国家 不 同 阶段 的 扩散 创新 ,在 模型 参数 中 引入 营销 
变量 ,并 对 模型 进行 了 标准 化 处 理 ,以 实现 扩散 的 持续 
性 。 

除 此 之 外 ,技术 增长 模型 在 新 兴 技 术 领 域 的 研究 
也 逐渐 成 熟 ,T，Daim 等 ' ”将 文献 计量 学 和 专利 分 析 
与 情景 规划 、 增 长 曲线 和 类 比 等 著名 技术 预测 工具 相 
结合 ,预测 了 燃料 电池 、 食 品 安全 和 光 存 储 3 个 新 兴 
Ño M. Kyebambe 等 ”为 了 验证 所 提出 的 监督 学 习 自 
动 标记 数据 方法 的 高 效 性 ,利用 美国 专利 商标 局 提供 
的 专利 引用 数据 ,使 用 专利 引用 方法 从 专利 引用 数据 
中 得 出 预测 因子 ,可 以 在 新 兴 技 术 出 现 至 少 一 年 之 前 
实现 70% 的 新 兴 技 术 预 测 。 

可 见 , 当 前 对 于 新 兴 研 究 主题 的 演化 曲线 特征 已 
经 有 诸多 研究 ,演化 曲线 存在 多 种 演化 特征 ,针对 不 同 
的 曲线 特征 又 衍生 出 多 种 拟 合 与 预测 模型 。 
2.2 拐点 时 间 的 应 用 

不 同 的 学 科 领 域 ,拐点 的 内 涵 有 所 不 同 。 从 哲学 
角度 看 ,拐点 是 解决 矛盾 和 事物 转变 的 关键 点 ， 
即 拐点 是 实现 事物 量变 到 质变 ,渐变 到 突变 的 点 。 数 
学 上 ,定义 拐点 为 平面 曲线 弯曲 方向 发 生 改 变 的 转折 
点 , 若 曲 线 图 形 在 一 点 由 凸 转 凸 ,或 由 四 转 凸 , 即 抛 点 
是 使 切线 穿越 曲线 的 点 。 在 拐点 求解 中 , 若 该 曲线 图 
形 的 函数 在 某 点 的 二 阶 导数 为 零 或 不 存在 , 且 二 阶 导 
数 在 该 点 两 侧 符号 相反 , 则 该 点 为 函数 的 拐点 。 
在 经 济 管理 领域 ,拐点 是 事物 发 展 曲线 中 具有 重大 意 
义 的 点 ,能 够 展望 未 来 的 不 确定 性 和 预警 潜在 风险 。 
尽管 各 个 领域 拐点 的 具体 含义 有 所 差异 ,但 普遍 意义 
上 拐点 是 指数 据 或 事物 增长 与 下 降 .兴盛 与 衰败 的 转 
折 点 ,拐点 前 后 演化 趋势 不 一 致 。 

各 个 领域 拐点 的 不 同 内 涵 体 现 为 曲线 拟 合 中 自 变 


列 ,并 根据 数据 分 布 特征 对 其 分 类 ,之 后 尝试 确定 不 同 
分 布 类 型 的 最 佳 增长 曲线 预测 模型 ,由 此 可 以 在 拟 合 


量 与 因 变 量 的 不 同 。 哲 学 领域 中 曲线 拟 合 的 自 变 量 大 
多 是 上 层 建筑 中 的 意识 形态 , 因 变 量 则 是 社会 发 展 ; 数 


模型 之 前 根据 数据 集 的 特征 为 特定 的 数据 集 选 择 最 优 


学 领域 多 研究 拐点 测量 的 公式 模型 ;经 济 管理 领域 关 
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注 市 场 与 金融 方面 的 拐点 ,以 达到 预测 走势 的 目的 , 通 
常 价格 .产量 ,销售 额 等 被 定义 为 自 变量 ,经 济 发 展 水 
平 与 行业 发 展 水 平定 义 为 因 变 量 。 也 有 部 分 专家 学 者 
将 拐点 应 用 于 与 情 预测 等 方面 ,丰富 了 拐点 应 用 范围 。 
代表 性 研究 如 下 : 

在 经 济 管理 领域 ,专家 学 者 多 利用 拐点 探测 经 济 
标的 发 展 趋势 。 例 如 ,“ 刘 易 斯 拐点 "”- 闻 利用 农业 
劳动 的 边际 生产 率 预测 拐点 ,由 此 判断 劳动 力 供给 趋 
势 。“ 库 效 涅 茨 拐点 " ”基于 收入 分 配 与 经 济 增长 
之 间 的 关系 ,判断 收入 分 配 差距 。“ 蒙 格 斯 拐点 " 则 是 
测算 边际 收益 与 边际 成 本 的 均衡 点 2 。 

在 拐点 的 应 用 过 程 中 ,不 少 专家 学 者 结合 领域 特 
点 ,面向 具体 应 用 场景 ,进一步 丰富 了 拐点 的 类 型 。 石 
陆 质 等 ”在 预测 股价 范围 的 研究 中 ,利用 时 间 - 股价 
(URR ELT EBASTEA WEO, -Yn )/ 
OR H (ya = y.407y, >R, 为 上 拐点 ,满足 (yu - 
My, >R H Ona -y,y, >R, 则 为 下 拐点 ,其 中 RR 
兰 要 定 闵 值 。 郑 步 青 等 ”结合 网 络 与 情 预 测 ,将 扣 点 
全 海 阶段 拐点 与 极 值 拐点 ,阶段 拐点 将 与 情 演化 分 为 
KR ERAT 3 个 阶段 。 

人 由 此 可 见 , 拐 点 时 间 在 不 同学 科 领 域 的 内 涵 不 同 ， 


难 潮 点 时 间 可 以 表征 研究 对 象 的 重要 转折 时 间 点 ” 


基于 曲线 拟 合 的 拐点 获取 方法 
它 近 年 来 , 贝 叶 斯 面板 VAR USO 和 隐 马 尔 可 
Jegpu ? 77 等 方法 开始 应 用 于 拐点 预测 ,F，Canova 
等 由 提出 基于 VAR 贝 叶 斯 面板 的 转折 点 预测 的 方 
法 ,用 于 7 国 集团 中 产 出 增长 率 的 拐点 预测 问题 。M. 
Billio 等 “将 VAR 模型 和 马尔 可 夫 模 型 相 结合 ,生成 
用 于 业务 周期 分 析 的 拐点 预测 方法 ;L.，Koskinen 等 
采用 隐 马 尔 可 夫 模 型 ,对 瑞典 和 美国 经 济 的 拐点 进行 
预测 。 之 后 ,R.F. Pelaez 等 ”提出 一 个 Logit 模型 能 
够 更 准确 地 预测 商业 周期 拐点 。N. Kulendran 和 K. 
K. F. Wong"" Jf Logit 模型 与 Probit 模型 结合 预测 经 
济 周期 的 拐点 。 

除 此 之 外 ,时 间 序 列 预测 模型 中 的 ARIMA 模 
5) 0 tsp dE F8] p 3] 43 pr" 7 o P 3E DERIT S 
点 预测 之 中 。 经 济 学 家 发 现 拐点 的 改变 与 增长 周期 之 
间 存 在 着 一 定 关联 ,但 时 间 序 列 模型 不 能 显著 呈现 出 
增长 趋势 与 增长 周期 ,因此 ,增长 曲线 模型 ( Growth 
Function) ”也 常 被 应 用 于 拐点 的 研究 。 其 中 Lo- 
gistic 曲线 分 析 在 预测 中 的 一 个 典型 应 用 是 M，King 


Hubbert 对 美国 石油 工业 储量 和 产量 的 分 析 。1962 年 ， 
M. King Hubbert 将 测量 国内 石油 累积 探 明 储量 和 累 
积 产量 的 Logistic 曲线 结合 起 来 ,预测 了 1968 年 美国 
石油 产量 的 峰值 , 比 实 际 峰 值 提前 了 两 年 “ 。 此 后 ， 
一 些 学 者 纷纷 开始 运用 Logistic 曲线 进行 拐点 分 析 的 
相关 研究 。 詹 新 宇 利用 Logistic 曲线 方程 预测 广西 产 
业 结 构 服 务 化 的 拐点 ,发现 使 用 增长 曲线 模型 预测 拐 
点 的 准确 性 较 高 。 

随 着 知识 关联 的 不 断 深入 ,灰色 预测 “| 与 神经 
12g 777 JE 8 T da s FLU 77 2E 6 Zr ep. H ZL B 
等 ”运用 相似 灰色 模型 对 股价 拐点 进行 预测 ,解决 了 
灰色 预测 模型 在 振荡 序列 中 预测 拐点 精度 不 高 的 问 
题 。0，Claveria 等 "通过 比较 多 层 感 知 器 网 络 、 径 向 
基 薄 数 网 络 和 埃 尔 曼 网 络 3 种 不 同 的 人 工 神经 网 络 技 
术 在 游客 需求 应 用 的 拐点 预测 ,发 现 多 层 感 知 器 网 络 
在 复杂 预测 中 的 精确 度 较 高 , 若 增 加 维度 可 以 提高 抛 
点 预测 的 精确 度 。 

由 于 产品 和 服务 都 需要 一 个 生命 周期 ,这 个 生命 
周期 包括 萌芽 .发展 .成熟 和 衰退 ,确定 产品 在 其 生 
周期 中 的 位 置 是 预测 拐点 的 另 一 种 方法 P. C. 
GUO 等 根据 生命 周期 理论 ,发 现 当 物流 指数 超过 均衡 
值 时 ,物流 业 会 对 经 济 产生 放大 效应 并 迎 来 物流 业 发 
RERA, P. N. Golder 4E?" 发 现 部 分 产品 销售 
曲线 的 急剧 增长 大 多 出 现在 新 产品 的 引入 阶段 到 成 长 
阶段 ,并 将 这 个 现象 称 为 "起飞 (Take Off) ”, 将 过 渡 点 
称 为 “起飞 点 ”。 

不 同 的 拐点 识别 与 预测 模型 , 均 旨 在 提高 特定 领 
域 拐点 预测 的 准确 性 。 缘 于 不 同 领域 甚至 相同 领域 的 
不 同 对 象 有 不 同 的 生命 周期 曲线 ,因此 没有 哪 种 方法 
是 最 优 的 ,需要 根据 该 领域 数据 分 布 特征 具体 分 析 。 


3 创新 路 径 关 键 时 间 点 与 获取 方法 


3.1 主题 分 布 的 拐点 时 间 
新 兴 研 究 主 题 是 创新 路 径 上 可 以 持续 发 展 的 主 
题 。 在 这 一 发 展 过 程 中 ,新 兴 研 究 主题 在 创新 路 径 上 
的 分 布 与 科学 发 现 及 技术 创新 的 规律 一 致 ,并 不 是 时 
间 轴 上 的 均匀 分 布 。 正 如 科技 创新 的 突破 往往 呈现 集 
群 式 突破 特征 ,创新 路 径 上 主题 包含 的 产 出 会 显示 出 
多 种 模式 ,如 逐渐 增加 逐渐 减少 、 先 升 后 降 、 先 降 后 
升 ,以 及 其 他 组 合 形式 。 因 此 ,如 何 展示 主题 在 时 间 轴 
上 的 动态 变化 值得 深入 分 析 。 

笔者 将 主题 中 包含 的 科学 文献 的 数量 作为 对 主题 
的 关注 度 和 影响 力 的 标志 。 通 常 , 在 取得 较 大 进展 或 
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突破 时 ,研究 主题 将 吸引 从 事 相同 或 密切 相关 研究 的 
科学 家 的 注意 甚至 加 入 ,并 且 随 着 时 间 的 推移 该 主题 
进展 得 到 更 广泛 的 扩散 ,得 到 更 多 关注 ,表现 为 科学 出 
版 物 的 数量 也 会 迅速 增加 并 最 终 趋 于 平稳 。 这 个 过 程 
可 以 用 增长 函数 曲线 表示 5 。 从 理论 上 讲 ,拐点 可 以 
在 较 早 的 时 间 点 捕获 有 影响 力 的 新 兴 研 究 主题 。 图 1 
为 创新 主题 的 生长 曲线 分 段 示意 图 。 图 1 PES) 
标记 的 时 间 点 是 论文 发 表 数 量 正 增长 率 发 生变 化 的 
点 ,标志 着 增长 率 转 为 下 降 的 时 刻 。 拐 点 附近 的 主题 
处 于 快速 增长 时 期 ,在 拐点 附近 ,主题 已 经 发 表 了 一 定 
数量 的 科学 文献 但 尚未 达到 最 大 数量 , 且 处 于 快速 增 
长 区 间 。 当 该 主题 的 出 版 物 数量 结束 快速 增长 进入 平 
稳 期 时 , 则 表征 着 该 主题 已 成 为 一 个 研究 热点 ,论文 发 
表 量 已 接近 最 大 数量 ,而 此 时 ,主题 已 过 了 最 有 创新 影 
MITIS A. 

3N 分 析 方法 与 流程 

《SG 首先 ,识别 新 兴 研 究 主题 ,根据 新 兴 研 究 主题 的 识 
二 明寺 (主题 的 新 颖 度 .增长 率 、 潜 在 社会 影响 力 .持续 


er d 
e : 
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CN 微观 聚 类 主题 
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CERE) 


关键 时 间 点 对 比分 析 


拐点 华 


员 | | 0-tl ;光伏 期 | 

党 11-0 ; 突破 期 

E 0-6 : 爆发 其 结束 快速 增长 ”稳定 期 
于 进入 平稳 期 

3b 

Pu 


E 
快速 增长 


10 tl t2 [d t4 时 间 (m 

1 创新 主题 的 生长 曲线 分 段 示意 
性 /连贯 性 \ 不 确定 性 ) ,筛选 出 新 兴 研 究 主 题 作 为 对 比 
分 析 对 象 。 其 次 ,绘制 新 兴 研 究 主 题 论文 发 表 时 间 分 


布 的 散 点 图 ,进行 曲线 拟 合 获得 3 种 关键 时 间 点 (拐点 
时 间 .首次 出 现时 间 ,平均 时 间 ) 。 再 次 ,绘制 拐点 时 间 
在 演化 曲线 图 中 的 坐标 标签 ,并 详细 分 析 不 同 拐点 类 
型 。 最 后 ,对 3 种 关键 时 间 进 行 对 比分 析 。 分 析 方 法 
模型 与 分 析 流程 见 图 2。 


标 标签 


拐点 类 型 划分 


图 2 方法 模型 与 分 析 流 程 


3.2.1 获取 新 兴 研 究 主 题 

新 兴 研 究 主 题 是 指 新 新 度 高 .发 展 相 对 快速 ,具有 
一 定 程度 的 连贯 性 和 较 大 的 科学 影响 力 的 研究 主题 ， 
并 有 可 能 对 社会 经 济 领域 产生 重大 影响 。 笔 者 基于 以 
往 研究 开展 进一步 探索 ,先前 研究 中 详细 论述 了 如 何 
识别 新 兴 研 究 主 题 的 多 维度 科学 计量 指标 ,包括 主题 
的 新 疾 度 、 主 题 的 增长 率 \ 主 题 发 展 的 潜在 经 济 社会 影 
响 力 .主题 发 展 的 持续 性 和 连贯 性 ,未 来 发 展 的 不 确定 


性 分 析 ”” 。 
3.2.2 识别 拐点 时 间 

主题 的 相关 出 版 物 数量 代表 着 该 主题 在 学 术 领 域 
内 的 有 影响。 本 文 将 干细胞 研究 的 相关 主题 作为 研究 对 
象 ,根据 每 个 主题 的 年 论文 发 表 量 ,绘制 每 个 主题 数据 
的 散 点 图 ,形成 该 主题 的 研究 发 展 路 径 。 之 后 ,通过 曲 
线 拟 合 ,计算 研究 发 展 路 径 中 的 拐点 ,并 针对 新 兴 研 究 
主题 与 非 新 兴 研 究 主 题 抛 点 特征 与 效用 进行 对 比分 析 。 
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HERA, KEA, 武 华 维 , 等 . 新 兴 研 究 主题 在 演化 路 径 上 的 关键 时 间 点 研究 [J]. 图 书 情报 工作 ,2021 ,65(8):51 - 64. 


笔者 尝试 利用 生长 函数 (Logistic Function ) 曲线 进 
行 散 点 的 曲线 拟 合 , 但 效果 不 理想 。 通 过 尝试 发 现 一 
元 三 次 函数 可 以 更 好 地 拟 合 本 研究 的 散 点 分 布 ,因此 ， 
笔者 采用 三 次 函数 拟 合 散 点 图 ,在 图 像 中 绘制 函数 曲 
线 , 输 出 拟 合 的 函数 。 
中 ,创新 路 径 上 拐点 获取 方法 如 下 : 

第 一 步 ,从 原始 数据 文件 中 提取 样本 数据 ,统计 每 
一 个 主题 年 度 (x) 所 发 表 的 论文 篇 数 (y) , 据 此 绘制 每 
一 个 主题 数据 的 散 点 图 。 

第 二 步 ,选择 拟 合 函数 拟 合 第 一 步 中 的 散 点 图 ,可 
视 化 拟 合 曲线 并 输出 拟 合 函 数 。 
第 三 步 ,根据 拟 合 曲线 计算 拐点 值 ,并 在 图 像 中 绘 


六 


制 拐点 位 置 。 
3.2.3 ”分析 拐点 类 型 

依据 拐点 时 间 出 现 的 区 间 范 围 ,将 拐点 类 型 分 为 
4 类 ;拐点 出 现在 分 析 时 间 区 间 内 拐点 出 现在 分 析 时 
间 区 间 之 前 、 拐 点 出 现在 分 析 时 间 区 间 之 后 、 拐 点 未 在 
分 析 时 间 区 间 内 出 现 。 
3.2.4 三 种 关键 时 间 点 的 对 比分 析 

为 了 进一步 证 实 拐点 在 预测 主题 发 展 趋势 方面 的 
效果 ,笔者 对 比 拐点 在 预测 分 析 新 兴 研 究 主题 与 非 新 
兴 研 究 主题 中 的 差异 ,并 区 分 首次 出 现时 间 .平均 时 间 
以 及 拐点 时 间 在 主题 预测 分 析 中 的 功能 。 拐 点 与 平均 
时 间 、 最 早 时 间 计 算 公式 如 表 1 所 示 : 


表 1 拐点 与 平均 时 间 、 最 早 时 间 公 式 


二 特征 时 间 计算 公式 变量 解释 模型 意义 
: 5 点 时 间 f(x) 2 ax? & bx? & cx & d a,b,c d 为 参数 任何 一 个 三 次 函数 都 存在 一 个 拐点 ,所 以 当 a0 的 时 
候 ,在 定义 域内 都 存在 拐点 
时 20] 2 为 时 间 ,n 为 时 间 点 的 总 个 数 ,i 为 起 始 的 z ! » 
" ar pan WINRAR WAANS Aea e ap a 


数据 集 与 统计 分 析 
干细胞 是 一 类 具有 自我 更 新 和 多 向 分 化 能 力 的 细 


胞 :是 生物 医学 领域 的 重要 研究 对 象 , 因 其 在 疾病 治疗 


得 生 医学 方面 的 重要 价值 和 巨大 发 展 前 景 ,干细胞 
在 编 合 科 学 和 医学 研究 中 引起 了 关注 。 笔 者 选择 干 细 
胞 侨 域 作为 本 文 方法 的 实证 领域 ,选用 Web of Science 
(可 ) 获 取 分 析 数 据 ,检索 日 期 为 2018 年 10 月 20 
日 谎 获 取 了 干细胞 研究 相关 的 422 101 篇 研究 论文 。 

具体 检索 策略 为 :TS = (("stem cells" OR " stem 
cell" ) NOT ("stem cellulose" or " stem Cellular" or " 
cello" or "cellar" or "cellphone" )) OR TS = ( (ESC or 
ASC or iPS or PGC or MSC or CSC or LSC or TSC or AD- 
SC or HSC) near (cells OR cell) ) OR TS = ((("totipo- 


tent" or "pluripotent" or " multipotent" or "unipotent" or 


"progenitor" or " precursor" ) NOT (" non-pluripotent" ) ) 
ADJ (cells OR cell) )) NOT TS = ("fuel cell" or " in- 
plane switching" or "Intrusion Prevention System" ) , 
社区 识别 是 分 析 大 型 复杂 网 络 结构 的 常用 方法 ， 
本 文通 过 引文 网 络 识别 有 意义 的 研究 主题 。V.， A. 
Traag 等 开发 了 Leiden 算法 ” ,该 算法 能 发 现 更 好 的 
社区 划分 ,提高 了 社区 之 间 的 有 效 连接 且 运 行 速度 更 
快 。 在 Leiden 聚 类 算法 下 , WoS 数据 库 的 所 有 论文 被 


[为 时 间 ,i 为 起 始 的 时 间 点 


表明 最 初 开始 的 时 间 


分 为 3 个 层级 ,宏观 层 有 22 个 主题 ,中 观 层 有 868 个 
主题 ,微观 层 有 4 047 个 主题 。 笔 者 基于 Leiden 算法 
采用 了 微观 层 主题 分 类 ,并 在 此 基础 上 进一步 分 析 新 
为 了 避免 数据 库 的 扩大 或 缩小 等 随机 波动 的 影 
响 ,笔者 采用 平滑 的 年 度 发 表 量 ,选取 2004 -2018 年 
为 研究 时 间 段 ,以 每 5 个 相 邻 年 份 为 一 组 设置 了 11 个 
时 间 切 片 。 在 研究 时 间 段 内 ,论文 的 发 表 数 量 呈 指数 
增长 ( 见 图 3)。422 101 条 记录 的 微观 主题 粒度 分 类 
涉及 不 同时 间 切 片 过 程 中 的 变化 ,如 2004 -2008 年 有 
1 584 个 微观 主题 ,2013 -2017 有 2 058 个 微观 主题 "3 
( 见 图 3)。 
4.2. 识别 主题 和 可 视 化 分 析 
干细胞 研究 主题 的 分 布 见 图 4, 节点 的 大 小 与 干 细 
胞 研究 的 论文 数量 成 比例 ,节点 越 大 表示 该 主题 的 论文 
数量 越 多 ; 主题 之 间 的 距离 越 小 ,表明 研究 内 容 越 相 近 。 
图 4 节点 上 的 数字 不 是 所 涉及 的 论文 数量 ,而 是 该 主题 
在 整个 WoS 数据 库 中 的 微观 层 分 类 标签 编号 。 干 细胞 
研究 相关 主题 主要 位 于 “生物 健康 ”区 域 日 涉 及 主题 数 
量 较 多 。 尽 管 Leiden 分 类 算法 建立 在 整个 WoS 数据 
库 的 基础 上 ,有 助 于 更 准确 地 发 现 全 局 主题 ,但 却 缺 乏 
具体 领域 特异 性 。 为 得 到 更 具 针 对 性 的 干细胞 主题 , 笔 
者 进一步 获取 干细胞 各 主题 在 Leiden 分 类 中 的 比例 ,并 
删除 了 仅 包含 少量 干细胞 论文 的 主题 。 
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4 2004 -2018 年 干细胞 研究 领域 的 主题 分 布 


结合 新 兴 研 究 主 题 的 识别 指标 , 即 主题 的 新 颖 度 
和 增长 率 对 候选 新 兴 研 究 主题 进一步 筛选 。 新 颖 度 和 
增长 率 包 含 4 个 指标 :论文 数量 .期刊 数量 .基金 数量 
和 作者 数量 的 平均 增长 率 。 论 文 数量 表征 主题 的 研究 
热度 ,期 刊 数 量 表征 该 主题 吸引 的 投稿 数 ,基金 数量 表 
征 主题 的 受 资助 情况 反映 国家 的 重视 程度 和 投入 力 
度 , 作 者 数量 表征 主题 受 学 者 的 关注 程度 。 新 兴 研 究 
主题 的 筛选 步 又 如 下 : 

第 一 步 ,探究 各 个 主题 全 阶段 的 增长 态势 。 首 先 


计算 每 个 主题 的 论文 数量 在 各 阶段 的 增长 率 ,再 计算 
该 主题 论文 数量 在 全 阶段 的 平均 增长 率 (i=10) ,把 握 
主题 出 现 的 时 间 和 整体 发 展 趋势 。 在 此 过 程 中 ,关注 
近期 (2010 年 之 后 ) 出 现 的 主题 ,而 对 于 近期 消失 的 主 
题 ,本 文 认 为 其 新 前 性 不 足 , 予 以 排除 ,初步 第 选 出 54 
个 新 兴 技 术 主 题 。 平 均 增长 率 公式 为 : 


a L 公式 (1) 
其 中 i 表示 时 间 段 ,N 表示 论文 数量 ,期 刊 数量 、 
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第 二 步 ,计算 与 各 个 主题 相关 的 期 刊 数 量 .基金 数 
量 \ 作 者 数量 在 全 阶段 的 平均 增长 率 (i =10)。 侧 除 平 
均 增 长 率 为 空 值 的 主题 , 空 值 表 示 该 主题 在 期 刊 .基金 
或 作者 数量 排名 统计 中 没有 进入 前 50 名 ,表明 该 主题 
的 研究 热度 或 受 关注 度 不 够 , 故 予 以 吻 除 。 最 后 吻 除 
10 个 主题 ,得 选 得 到 44 个 新 兴 技 术 主 题 。 

第 三 步 ,分 析 各 个 主题 近期 的 增长 趋势 。 选 择 后 


5 个 阶段 作为 分 析 时 间 窗 (i=4) ,计算 剩余 主题 论文 
数量 在 后 5 个 阶段 的 平均 增长 率 。 剔 除 后 5 个 阶段 平 
均 增 长 率 为 负 值 的 主题 , 负 值 表 明 该 主题 论文 数量 在 
近期 呈 递 减 趋势 , 共 剔 除 18 个 主题 。 

最 终 ,筛选 出 26 个 新 兴 研 究 主题 ,鉴于 篇 幅 限制 ， 
表 2 列 出 了 论文 数量 平均 增长 率 ( 降序 排列 ) 最 高 的 
10 个 主题 的 主题 标签 和 内 容 概述 。 


表 2 干细胞 领域 新 兴 研 究 主题 (部 分 ) 


主题 编号 主题 标签 (关键 词 ) 主题 概述 
353 stem cell .cell , surface , mesenchymal stem, EXTRACELLULAR MATRIX ,substrate , differentia- Extracellular matrix could modulate stem cells fate 
tion „tissue „hydrogel „biomaterial 
2276 stem cell, intestinal stem expression , organoid , cancer, intestinal, COLORECTAL CANCER, Stem cells in intestinal epithelium 


crypt , model .Lei 


VITRO ,regeneration ,decellularized 


stem cell, scaffold, tissue engineering, cell, extracellular. matrix, tissue, mesenchymal stem, 


Decellularized stem cell in tissue-regenerative medi- 


cine 


DNA methylation in stem cells 


Nex DNA methylation STEM CELL , epigenetic , gene , gene expression, EMBRYONIC STEM , expres- 
N sion „human ‚cell , development 

( ^60 stem cell , mesenchymal stem, ARTICULAR CARTILAGE , scaffold , tissue engineering , chondro- 
e cyte „chondrogenic differentiation „bone marrow „growth factor „cartilage repair 

21 stem cell „dental pulp „expression , periodontal ligament , mesenchymal stem , pulp stem „osteogenic 


differentiation ,human dental , VITRO „growth factor 


beta catenin „stem cell , Wntsignaling „expression , Wnt beta „signaling pathway ,cell ‚catenin signa- 


Stem cells provide sources for cartilage tissue engi- 


neering 


Human dental pulp stem/progenitor cells ( hDP- 


SCs) based therapy for bone tissue engineering 


Regulation of Wntsignaling pathway in stem cells 


ling , protein „gene 


e STEM ,chromatin 


`» tient AML „hematopoietic stem \ leukemia AML treatment 

» 

H umm 

Qul stem cell, retina , transplantation , cell , differentiation , retinal. pigment , photoreceptor , pluripotent 
3 

pt stem, MACULAR DEGENERATION , progenitor cell 


4 E 新 兴 研 究 主题 拐点 特征 分 析 
-加 利用 一 元 三 次 函数 ,通过 三 次 导 函 数 的 值 进行 判 
Ilf e Cx) 的 三 次 导数 不 为 0, 则 该 点 为 拐点 。 考 虑 到 还 
在 初期 发 展 阶段 的 主题 ,拐点 也 可 能 在 研究 时 段 区 间 之 
外 ,本 研究 未 给 予 拐点 值 阔 值 限制 ,比如 限制 在 数据 分 
析 范 围 内 。 若 该 聚 类 中 的 样本 个 数 少 于 4 时 , 则 无 法 进 
行 函数 拟 合 , 拐点 无 法 根据 数据 的 模型 拟 合计 算得 出 。 
获取 拐点 数据 后 ,结果 是 否 都 合理 需 进 一 步 分 析 。 
4.3.1. 新 兴 研 究 主题 的 拐点 类 型 划分 

(1) 拐点 出 现在 分 析 时 间 区 间 内 。19 个 新 兴 研 究 
主题 的 拐点 出 现在 分 析 时 间 区 间 内 ,分 别 为 #2 .#60、 
#107 #142 #254 #353 #461 #581 #648 #710 #814. 
#867 #921 #965 41046 .#1095 \#1142 #1199 #1460 ,这 
些 主题 在 分 析 时 间 段 内 形成 了 最 早 有 影响 力 的 时 间 
js DA#581 A107 为 例 绘制 带 有 拐点 的 演化 曲线 图 ， 
箭头 指向 的 圆 点 为 拐点 时 间 ( 见 图 5) 。 主 题 的 拐点 出 
现在 时 间 段 内 的 时 间 越 晚 越 可 能 是 新 兴 研 究 主 题 。 


stem cell, EZH2 , expression , cell, gene, protein, gene expression , differentiation, EMBRYONIC 


acute myeloid , myeloid leukemia , stem cell myelodysplastic syndrome, cell transplantation , pa- 


The role of histone methyltransferase EZH2 in stem 


cell fate 


Clinical application of hematopoietic stem cells 


Application of stem cells in retinal degenerative dis- 


eases 


#581 2009 年 左右 出 现 拐 点 时 间 , 而 #107 在 2014 年 
左右 出 现 拐点 时 间 。 

(2) 拐点 出 现在 分 析 时 间 区 间 之 前 。 有 两 个 新 兴 
究 主题 的 拐点 出 现在 时 间 区 间 之 前 ,分 别 为 所 61 #221 
( 见 图 6)。 结 合 领域 专家 分 析 以 及 对 拟 合 曲线 的 分 析 ， 
发 现 对 该 类 型 预测 失误 源 自选 取 三 次 函数 为 模型 的 假 
设 , 事 实 上 ,这 两 个 主题 尚 处 于 发 展 的 早期 阶段 ,未 到 达 
其 拐点 时 间 。 

(3) 拐点 出 现在 分 析 时 间 区 间 之 后 。 有 两 个 新 兴 
研究 主题 的 拐点 出 现在 时 间 区 间 之 后 ,分 别 为 #727 和 
3469 ( WEIT) ,可 以 预见 到 拐点 会 出 现在 未 来 一 段 时 
间 。 但 发 现 对 主题 #469 未 来 拐点 时 间 的 预测 可 能 存 
在 问题 ,结合 领域 专家 分 析 和 数据 特征 ,主题 #469 确 
实处 于 快速 发 展 阶 段 ,但 拐点 的 发 文 量 可 能 要 超过 预 
测 结果 。 因 此 ,拐点 出 现在 分 析 时 间 段 之 后 的 预测 ,也 
可 能 会 出 现 失误 ,但 拐点 的 预测 结果 依旧 可 以 反映 该 
主题 当前 还 处 于 拐点 出 现 前 的 发 展 阶段 。 


«lin. 


[my 
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Cluster idl #581 s infection point 


f(x)-—0. 1233 738.39x74—1483129.46x4.902987241.61 


Infection point at 
(2008.65, 237.80) 


* original values 
—— curve fit values 


2000.0 2002.5 2005.0 2007.5 2010.0 2012.5 2015.0 2017.5 


x axis 


Cluster idl £107 s infection point 


fo=-0.013G+31.48x2+-63384.08x+42535019.85 


rectid n point at 
(2013.55, 106.00) 


100 
E 
E 
^ 80 
60 
* original values 
40 —— curve fit values 


2000.0 2002.5 2005.0 2007.5 2010.0 2012.5 2015.0 2017.5 


x axis 


E 5 ”拐点 出 现在 分 析 时 间 区 间 内 


Cluster idl &16l' s infection point 


500 f(x)-—0.03x*- 196.36374-302305.52x4.—261268622.70 


400 


RI 


E 
& 300 
200 


* original values 


Infection point at 
—— curve fit values 


(1997.84, 84.03) 


100 
9< 一 一 


202304.00627v1 


x axis 


Cluster idl 4727 s infection point 


chinaXiv 


íix)--0.0139437.60::4—76008.42:45120881247 infection point at 
(2019.48, 224.75) 
* * original values 
— curve fit values 


2000.0 2002.5 2005.0 2007.5 2010.0 2012.5 2015.0 2017.5 2020.0 
x alis 


1997.5 2000.0 2002.5 2005.0 2007.5 2010.0 2012.5 2015.0 2017.5 


Cluster idl 4221' s infection point 


f(x)-—0.00x--11.7532--23429.25x:—15583130.98 


Infection point at * original values 
e (1994.86, —23.77) — curve fit values 
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x axis 


E 6 ”拐点 出 现在 分 析 时 间 区 间 之 前 


Chuster_idl #469 s infection point 


* 


00 1(x)-0.01354-—51.7432--105276.023--—71403278.87 


infection|point at 


(2034.86] 295.35) 


„a 200 
ki 
- 

150 

100 

50 * original values 
— curve fit values 
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x alis 


图 7 拐点 出 现在 分 析 时 间 区 间 之 后 


(4) 拐点 未 在 分 析 时 间 区 间 内 出 现 。 有 3 个 主题 
未 能 利用 本 文 方法 得 到 拐点 时 间 ,分 别 为 所 290 #2276 
IH261 ,其 中 #1290 #2276 的 演化 曲线 见 图 8。 从 图 8 
中 可 以 看 出 拐点 未 出 现 的 主要 原因 是 这 些 主题 还 处 于 


新 兴 研 究 主 题 的 早期 发 展 阶段 , 尚 不 能 做 出 拐点 值 的 
预测 。 


4.3.2. 新兴 研究 主题 的 拐点 时 间 与 平均 时 间 对 比 

26 个 新 兴 研 究 主题 的 拐点 与 平均 时 间 对 比 见 表 
3。 表 3 中 第 5 列 “ 时 间 差 _INF-AVG” 为 “平均 时 间 _ 
AVG" 与 “拐点 时 间 _INF” 的 差 值 。“ 时 间 差 _INF- 
AVG” 的 值 为 正 , 则 "拐点 时 间 _INF" 早 于 "平均 时 间 -_ 
AVG” ; 值 为 零 , 则 “拐点 时 间 _INF" 等 于 “平均 时 间 _ 
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Cluster idl #1290 s infection point 
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Cluster idl #2276 s infection point 


* 
f(x)-—0.00:7--4.96x24-—11463.73x--8674922.61 
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1504 
E 
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> 
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504 
* 
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x axis 


图 8 拐点 未 在 分 析 时 间 区 间 出 现 


AVG”; 值 为 负 , 则 “拐点 时 间 _INF” 晚 于 “平均 时 间 _ 
AYC”。 基 于 拐点 值 是 对 主题 最 早 具备 较 大 影响 力 的 
认 混 ,那么 对 于 新 兴 研 究 主题 “时间差 _INF-AVG”" 为 
正和 俏 时 ,表明 在 统计 时 间 段 内 ,利用 拐点 时 间 可 以 比 平 
全 更 早 识别 该 主题 的 影响 力 ; “时间 差 _INF-AVG” 为 
凭 便 时 表明 该 主题 尚未 到 达 具 备 一 定 影响 力 的 阶段 。 
Ss 于 从 表 3“ 时 间 差 _INF-AVG” 一 列 可 以 看 出 ,除去 没 

点 时 间 的 主题 #261 #1290 51422276 ,剩余 的 23 个 
HAF, A 6 个 主题 的 “时 间 差 _INF-AVG” 为 负 值 ,3 
丛书 题 的 “时 间 差 _INF-AVG ”为 零 ,而 有 17 个 主题 的 
“时 间 差 _INF-AVG” 为 正 值 。 由 此 证 明 在 干细胞 研究 
领 书 ,拐点 时 间 可 以 比 平均 值 时 间 更 早 识别 有 影响 力 
f 

GS 新兴 研究 主题 差 值 大 于 5 年 的 有 两 个 ,分 别 为 主 
题 太 21 和 机 61 ,拐点 都 在 1998 年 之 前 ,经 核实 属于 数 
据 役 合 错误 ,这 两 个 主题 实际 上 还 处 于 主题 发 展 的 时 
期 阶段 。 
4.3.3 非 新 兴 研 究 主题 的 拐点 类 型 划分 

与 新 兴 研 究 主题 一 致 ,也 将 28 个 非 新 兴 研 究 主题 
的 拐点 类 型 分 为 4 类。 在 本 实证 分 析 中 ,对 于 非 新 兴 
究 主题 ,并 没有 拐点 出 现在 分 析 时 间 区 间 之 后 的 情况 ， 
这 与 非 新 兴 研 究 主题 自身 特征 相关 ,因为 非 新 兴 研 究 主 
本 身 在 筛选 过 程 中 就 可 能 是 近期 增长 缓慢 的 主题 。 
(1) 拐点 出 现在 分 析 时 间 区 间 内 。22 个 非 新 兴 
究 主 题 的 拐点 出 现在 分 析 时 间 段 的 区 间 内 。 以 才 99 和 
#3 为 例 ( 见 图 9) ,这 些 主题 在 分 析 时 间 段 内 形成 了 最 
早 有 影响 力 的 节点 。 拐 点 出 现在 时 间 段 内 的 时 间 越 晚 ， 
表明 主题 越 是 新 兴 研 究 主 题 。#99 在 2002 年 左右 出 现 
拐点 时 间 , 而 起 3 在 2014 年 左右 才 出 现 抛 点 时 间 。 

(2) 拐点 出 现在 时 间 区 间 之 前 。 鉴 于 干细胞 领域 


E 


RI ”新兴 研究 主题 的 拐点 时 间 与 平均 时 间 对 比 


(单位 /年 ) 
主题 序号 首次 出 现 拐点 时 间 _ 平均 时 间 _ 时 间 差 _ 
MS 时 间 INF AVG INF-AVG 

221 2000 1994 2009 15 
161 2000 1998 2010 12 
2 2001 2010 2014 4 

254 2000 2009 2012 3 
710 2000 2009 2012 3 
1046 2000 2010 2012 2 
1095 2000 2008 2010 2 
142 2000 2010 2011 1 
461 2000 2009 2010 1 
581 2000 2009 2010 1 
648 2000 2009 2010 1 
814 2000 2009 2010 1 
867 2000 2008 2009 1 
1142 2000 2009 2010 1 
921 2000 2010 2010 0 
965 2000 2009 2009 0 
1199 2000 2009 2009 0 
60 2000 2011 2010 -1 
353 2000 2012 2011 -1 
1460 2000 2011 2010 -1 
107 2000 2014 2008 -6 
727 2000 2019 2010 -9 
469 2000 2035 2009 -26 
261 2000 - 2010 - 
1290 2000 = 2010 = 
2276 2000 - 2010 - 


的 研究 始 于 20 世纪 90 年 代 , 大 部 分 研究 主题 还 处 于 
新 兴 领 域 ,早期 信号 不 足 , 拐 点 可 能 在 数据 之 外 是 合理 
的 。 本 研究 中 ,有 4 个 非 新 兴 研 究 主题 的 拐点 出 现在 
分 析 时 间 段 之 前 ,分 别 是 可 03 4285 #1623 1134638 。 


59 


ChinaXiv 合 作 期 刊 


&)4 dia xi 


第 65 卷 第 8 期 2021 年 4 月 


Cluster idl #899 s infection point 


Cluster idl #23 s infection point 
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以 埠 03 FU#1638 为 例 ( 见 图 10) ,结合 领域 专家 分 析 以 
及 对 拟 合 曲线 的 分 析 , 发 现 对 该 类 型 预测 失误 源 自 选 
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图 9 


取 三 次 函数 为 模型 的 假设 ,事实 上 ,这 两 个 主题 还 处 于 


X axis 


拐点 出 现在 分 析 时 间 区 间 内 


自身 发 展 的 早期 阶段 ,尚未 到 达 拐 点 时 间 。 


10 ”拐点 出 现在 分 析 时 间 区 间 之 前 


长 趋势 ,并 在 近期 有 增长 变 缓 的 趋势 ,如 图 11 所 示 : 


3) 拐点 未 出 现在 分 析 时 间 区 间 内 。 两 个 非 新 兴 
题 4401 18588 ,在 分 析 时 间 段 内 未 出 现 快速 增 
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Cluster idl 4588' s infection point 
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11 拐点 未 出 现在 分 析 时 间 区 间 


4.3.4 非 新 兴 研 究 主 题 的 拐点 与 平均 时 间 对 比 
从 表 4 中 可 以 看 出 ,第 5 列 为 28 个 非 新 兴 研 究 主 


题 “ 平 均 时 间 _AVG” 与 “拐点 时 间 _INF” 的 差 值 “时 间 
差 _INF-AVG”。 依据 拐点 值 是 对 主题 最 早 具 备 较 大 影 
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响 力 的 认识 ,对 于 非 新 兴 研 究 主题 , “时间差 _INF- 
AVG” 的 值 为 正 值 表 明 利 用 拐点 时 间 可 以 比 平均 值 更 
早 识别 该 主题 的 影响 力 ; “时间差 INF-AVG" 的 值 为 负 
值 表明 在 统计 时 间 段 内 ,该 主题 尚未 到 达 该 主题 发 展 
的 具备 一 定 影响 力 的 阶段 。 

从 “时 间 差 _INF-AVG” 可 以 看 出 ,除去 没有 拐点 时 
间 的 主题 #40 7814588 ,剩余 26 个 主题 中 ,有 6 个 主题 的 
“时 间 差 _INF-AVG ”为 负 值 ,3 个 主题 的 “时 间 差 _INF- 
AVGC ”为 零 , 而 有 17 个 主题 的 “时 间 差 _INF-AVG” 为 正 。 

相 较 于 新 兴 研 究 主题 , 韭 新 兴 研 究 主题 的 正 向 差 
值 更 大 , 差 值 不 小 于 5 年 的 有 12 个 ,拐点 时 间 均 早 于 
2007 年 ,表明 这 些 主题 已 经 过 了 有 影响 力 的 早期 阶 
段 ,已 不 属于 新 兴 研究 主题 。 

本 主题 #1306 #23 、#271 和 #1265 的 “时 间 差 _INF- 
AyC" 的 值 为 负 值 , 表 明 在 统计 时 间 段 内 ,该 主题 尚未 到 
述 同 备 一 定 影响 力 的 阶段 ,也 尚未 成 为 新 兴 研 究 主 题 。 

《CS 因此 ,对 于 干细胞 新 兴 研 究 主题 ,利用 拐点 时 间 可 
VERE t a IU 影响 力 的 主题 ,上 且 拐 点 对 
扩 新 兴 研 究 主 题 分 析 更 为 有 效 。 

表 4” 非 新 兴 研 究 主题 拐点 时 间 、 平 均 时 间 与 


9 : S 
CN 首次 出 现时 间 对 比 (单位 /年 ) 
| 
N Es E "" "MR "ne 
Cha 首次 出 现 —— 损 点 时 间 。 平均 时 间 。 时间 差 _ 
CP 时 间 INF AVG INF-AVG 
LE 
1623 2000 1960 2011 51 
a1638 2000 1995 2010 15 
25; 2000 1996 2009 13 
Q85 2000 1998 2010 12 
(916 2000 2005 2014 9 
1297 2000 2004 2013 9 
ES 2000 2002 2010 8 
7 2000 2002 2010 8 
594 2000 2004 2011 7 
168 2000 2005 2011 6 
446 2000 2007 2012 5 
850 2000 2005 2010 5 
467 2000 2005 2009 4 
215 2000 2008 2010 2 
875 2000 2006 2008 2 
2508 2000 2008 2010 2 
810 2000 2008 2009 1 
217 2000 2009 2009 0 
659 2000 2011 2011 0 
686 2000 2010 2010 0 
451 2002 2013 2012 a4 
2275 2000 2012 2008 -4 
1306 2000 2016 2011 =5 
23 2000 2017 2010 =7 
271 2000 2016 2009 E 
1265 2000 2016 2009 -1 
401 2000 m 2010 : 
588 2000 = 2009 = 


4.3.5 ”新 兴 研 究 主 题 与 非 新 兴 研 究 主 题 的 拐点 效用 
对 比 

通过 对 比 发 现 :拐点 对 于 新 兴 研 究 主题 分 析 更 为 
有 效 , 存 在 数据 拟 合 错误 的 情况 更 少 。 这 主要 是 新 兴 
研究 主题 呈现 持续 增长 趋势 ,三 次 函数 的 拟 合 效果 也 
更 理想 。 对 于 非 新 兴 研 究 主题 而 言 , 其 主题 发 展 趋势 
的 模式 除去 在 一 段 时 间 内 呈现 平稳 增长 或 快速 增长 以 
外 ,可 能 存在 更 多 发 展 模 式 ,如 趋 于 平稳 或 下 降 。 
此 ,对 于 非 新 兴 研 究 主题 ,其 拐点 时 间 分 布 更 不 确定 ， 
预测 函数 出 错 的 几率 也 更 高 。 总 体 来 说 ,拐点 对 于 新 
兴 研 究 主题 的 识别 效果 更 加 稳定 。 
4.4 三 种 关键 时 间 点 的 对 比 与 应 用 策略 

首次 出 现时 间 ,平均 时 间 ` 抛 点 时 间 分 布 优 缺点 见 
表 5。 尽 管 抛 点 时 间 有 其 自身 的 重要 性 ,但 并 非 仅 使 
用 拐点 值 就 可 以 完全 实现 主题 的 预测 分 析 。 研 究 主题 
会 出 现在 路 线 图 的 不 同时 间 段 ,而 不 同时 间 点 的 意义 
区 别 显 著 , 创 新 路 径 中 主题 分 布 时 间 的 确定 需要 综合 
3 种 时 间 类 型 。 首 次 出 现 是 该 主题 最 早出 现 的 信号 ， 
适合 使 用 定量 分 析 手 段 ,但 由 于 数据 量 稀少 ,难以 得 到 
关注 ;对 于 一 个 主题 如 果 达 到 拐点 则 需要 警戒 ,考虑 是 
否 需要 及 早 布局 ;平均 值 则 可 以 表征 该 主题 是 否 已 经 
成 为 一 个 研究 热点 。 

表 5 三 种 时 间 分 布 优 缺 点 


特征 时 间 优点 缺点 


Mc 


首次 出 现 ”首次 出 现时 间 必 然 会 存在 且 ”影响 力 不 足 ,难以 引起 注意 
时 间 容易 获取 ,是 主题 出 现 的 最 早 
信号 
平均 时 间 ”平均 值 时 间 一 定 会 存在 且 容 ”由 于 主题 论文 发 表 的 时 间 一 
易 获 取 , 可 从 数量 特征 上 表现 。 般 遵 照 指数 增长 模式 ,因此 平 
主题 的 影响 力 岁 值 一 般 往往 容易 滞后 ,难以 


评估 这 种 影响 力 
拐点 时 间 ”拐点 可 以 更 好 地 表征 主题 发 ”可 能 不 存在 
展 的 影响 力 变化 。 如 果 拐 点 
时 间 早 于 平均 时 间 ,利用 拐点 
更 早 预测 主题 的 影响 力 ;如 果 
拐点 晚 于 平均 时 间 ,说 明 该 主 
题 依旧 处 于 早期 发 展 阶段 


可 能 来 自 于 
数据 本 身 ,也 可 能 来 自 数据 的 
拟 合 失误 。 不 同 拟 合 函数 ,也 
存在 预测 失误 的 情况 


5 结语 


本 文 主要 侧重 分 析 不 同时 间 特 征 的 主题 发 展 差 
异 , 尤 其 是 对 早期 识别 新 兴 研 究 主 题 具 有 重要 作用 的 
生长 曲线 的 拐点 时 间 。 笔 者 对 比分 析 了 首次 出 现时 
间 .平均 时 间 和 拐点 时 间 的 差异 ,探讨 新 兴 研 究 主题 最 
早 具 有 影响 力 的 时 间 点 。 同 时 ,该 方法 不 仅 适 用 于 发 
文 数量 ,也 适用 于 其 他 反映 主题 生长 曲线 拐点 分 析 , 如 
引文 曲线 的 拐点 分 析 等 。 笔 者 将 干细胞 研究 主题 作为 
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实证 研究 对 象 ,通过 曲线 拟 合 得 到 所 识别 的 新 兴 研 究 
主题 的 创新 发 展演 化 路 径 ,并 计算 出 研究 发 展 路 径 中 
的 拐点 。 研 究 成 果 有 助 于 改进 主题 演化 路 径 的 准确 
性 ,提高 主题 演化 路 径 在 新 兴 研 究 主题 的 前 瞻 预 判 与 
布局 的 准确 性 。 

本 研究 主要 结论 如 下 :首先 ,笔者 依据 拐点 时 间 出 
现 的 区 间 范 围 将 拐点 类 型 分 为 4 类 :拐点 出 现在 分 析 
区 间 内 拐点 出 现在 分 析 区 间 之 前 ,拐点 出 现在 分 析 区 
间 之 后 .拐点 未 出 现在 分 析 区 间 内 。 通 过 对 新 兴 研 究 


主题 与 非 新 兴 研 究 主题 的 抛 点 特征 分 析 , 大 部 分 拐点 
出 现在 分 析 时 间 段 的 区 间 内 ,说 明 拐 点 对 于 新 兴 研 究 


主题 的 预测 具有 较 好 的 效用 性 。 其 次 ,对 比分 析 新 兴 
研究 主题 与 非 新 兴 研 究 主题 的 拐点 时 间 与 平均 时 间 ， 
恬 现 利用 拐点 时 间 可 以 比 平均 值 时 间 提 前 识别 有 影响 
力 的 主题 。 再 次 ,对 新 兴 研究 主题 与 非 新 兴 研究 主题 
的 换 点 效用 进行 对 比 ,发 现 拐点 对 于 新 兴 研 究 主题 分 
棉 轿 为 稳定 有 效 , 存 在 拟 合 错误 的 情况 更 少 ;而 对 于 非 
靳 驱 研 究 主 题 而 言 , 其 损 点 时 间 分 布 更 为 不 确定 ,预测 
函数 出 错 的 几率 也 更 高 。 最 后 ,首次 出 现时 间 ,平均 
间 却 拐点 时 间 在 主题 发 展 路 径 中 意义 区 别 显 著 ,创新 
路 径 中 主题 分 布 时 间 需 要 综合 应 用 3 种 时 间 类 型 。 
本 研究 也 存在 几 个 缺陷 :首先 ,笔者 使 用 一 元 三 次 
顶 几 的 假设 前 提 无 法 提供 严谨 的 论证 ,分 析 侧重 从 科 
学 评 量 学 中 寻找 依据 ,从 科学 计量 的 实践 中 分 析 意义 
二 各 用 价值 。 本 文 尚未 考虑 其 他 数据 分 布 类 型 , 且 并 
非 慨 有 曲线 都 遵照 寒 函数 的 方式 ,这 也 是 导致 所 点 识 
别 括 误 的 主要 原因 。 其 次 ,三 次 函数 无 法 有 效 识别 多 
个 男 点 的 情形 ,逻辑 生长 曲线 也 不 适合 所 有 主题 的 数 
据 拟 合 , 导 致 计量 结果 存在 一 定 程度 的 失真 。 出 现 这 
种 情况 的 原因 在 于 每 个 主题 都 有 自身 发 展 特征 ,未 来 
将 尝试 使 用 多 个 指标 并 结合 具体 领域 的 数据 特征 展开 
分 析 。 再 次 ,本 文 的 分 析 数据 源 主要 是 科学 论文 ,论文 
主要 体现 领域 的 基础 研究 成 果 , 而 专利 可 以 体现 一 个 
领域 的 应 用 发 展 趋势 。 当 前 科技 领域 的 发 展 往往 是 基 
础 研究 与 应 用 研究 协同 并 进 ,因此 单一 文献 类 型 不 能 
全 面 衡量 领域 的 发 展 趋势 。 未 来 将 尝试 结合 专利 数 
据 、 产 业经 济 数据 等 多 源 数据 类 型 ,形成 对 领域 创新 发 
展 更 全 面 的 曲线 模拟 ,拐点 识别 更 准确 。 此 外 ,未 来 将 
尝试 对 数据 进行 散 点 拟 合 的 智能 化 ,通过 自 适应 过 程 
识别 每 个 主题 分 布 曲线 的 最 佳 拟 合 函 数 。 同 时 ,将 收 
集 具体 领域 的 全 过 程 数 据 ,尤其 是 主题 的 产生 萌芽 期 ， 
以 期 通过 这 些 措施 更 准确 地 曲线 拟 合 得 到 更 准确 的 拐 
点 时 间 。 
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Abstract: | Purpose/significance | To explore the different representations of the impact of different key time 

"points on emerging research topics. | Method/process | Firstly, we summarized the application scenarios and acqui- 
f n methods of the current turning point time, and constructed the turning point identification method of emerging 
fesearch topics on the innovation evolution path according to the growth mechanism and characteristics of network 

- modes in the knowledge diffusion. After that, the differences between "first appearance time" "average time" and 
€inflection point time" are compared and analysed, and explored the earliest point in time when emerging research 
topics have an impact. Finally, taking stem cell research topics as an empirical field, we analysed the different rep- 
resentational capabilities of different key time points on the influence of emerging research topics. | Result/conclu- 
sion | The turning point time can identify influential topics earlier than the "average time". "First appearance time" 
" average time" and “inflection point time" have significant differences in the topic evolution path. The determination 
of the distribution time of emerging research topics in the innovation path requires the synthesis of three different 
types of key time points. 
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